2025-01-28 10:34:39.AIbase.
DeepSeek lança novo modelo multimodal de IA, Janus-Pro, com recursos aprimorados
2025-01-15 08:41:23.AIbase.
A Alibaba DAMO Academy lança o modelo multimodal Valley 2 para cenários de comércio eletrônico
2025-01-08 17:10:10.AIbase.
Ex-especialista em visão da Microsoft, Hu Han, junta-se à Tencent para liderar o desenvolvimento do modelo multimodal HunYuan
2024-11-19 13:51:41.AIbase.
Equipe da Universidade de Pequim lança o modelo multimodal LLaVA-o1, com capacidade de raciocínio comparável à do GPT-o1!
2024-11-19 09:54:07.AIbase.
Mistral lança o Pixtral Large, seu modelo multimodal de código aberto mais poderoso, e atualiza o Le Chat para acesso direto ao Flux Pro
2024-10-25 11:16:59.AIbase.
Pesquisa de IA da Salesforce lança novo modelo multimodal BLIP-3-Video: compreensão de vídeo de baixo custo
2024-09-20 09:06:14.AIbase.
Alibaba International lança o Ovis, um novo modelo multimodal de IA que fornece etapas de cozimento apenas olhando para os pratos
2024-08-26 13:54:33.AIbase.
Yun Zhi Sheng lança o modelo multimodal Shan Hai: com troca livre de timbre e compreensão de cenários visuais
2024-08-19 14:44:01.AIbase.
Alibaba lança o modelo multimodal mPLUG-Owl3: assista a filmes de 2 horas em 4 segundos
2024-08-16 17:23:10.AIbase.
Moore Threads e Knowin AI firmam parceria e concluem adaptação do modelo multimodal "Uma Folha Leve"
2024-08-02 09:04:21.AIbase.
Google lança versão experimental do Gemini 1.5 Pro, um poderoso modelo multimodal que supera GPT-4o e Claude-3.5 Sonnet
2024-07-04 15:57:03.AIbase.
网易伏羲 lança marca de robôs "Lingdong" e apresenta o modelo multimodal "Yisheng Zhu Xiang"
2024-06-27 16:41:35.AIbase.
LeCun lança novo modelo multimodal de visão Cambrian-1; capacidades visuais superam o GPT-4V
2023-12-07 08:33:07.AIbase.
Google lança o modelo multimodal Gemini 1.0, previsto para desenvolvedores no início do próximo ano
2023-11-03 09:35:33.AIbase.
UC Santa Cruz desenvolve o modelo multimodal de código aberto MiniGPT-5
2023-10-12 09:26:09.AIbase.
Ex-alunos da Universidade de Zhejiang e Microsoft lançam modelo multimodal LLaVA, desafiando o GPT-4V
2023-09-20 11:55:56.AIbase.
OpenAI lança modelo multimodal GPT-Vision para competir com o Gemini do Google
2023-08-29 10:56:44.AIbase.